Amazon : Livres sur la recherche web


DSI. Le carnet des sites de recherche

par Marc Duval, bibliothécaire prof.
Service de recherche documentaire DSI
Boucherville. Québec. Canada

Contrat Creative Commons
Mise à disposition sous un contrat Creative Commons.

Index abrégé du site de DSI : Les actualités des sites de recherche
Les fiches techniques: AlltheWeb, AltaVista, AntiSearch, Google, HotBot, MSN Search, Northern Light, Voila - Tout le web francophone
/ Chronique de la recherche / Classement des automates de recherche / Les langages des automates de recherche
/ Le mot-clé / La nature du web / Le nom de domaine

Descripteurs : Bibliothèques ; (vedettes matières) : recherche sur Internet ; recherche de l'information ; recherche documentaire ; ouvrages de références ; gestion de l'information / Nomade : recherche sur le Web ; blogs / ODP : recherche sur le Net ; weblogs / Toile du Québec : gestion de l'information ; Internet - Guides ; guides perfectionnement à la recherche ; blogues / Voila : internet - recherche d'info sur le web ; blogues / Yahoo : recherche sur le Net ; recherche sur le Web ; recherche et traitement de l'information ; internet - information et documentation ; blogs / Pages jaunes: renseignements-service Longueuil / Identificateurs : moteurs de recherche ; moteur de recherche ; répertoires de recherche ; répertoire de recherche ; annuaires de recherche ; annuaire de recherche

Ancien site ( dernier message  [2005-05-24] MSN sur les traces de Google Maps)
[Atom] /
Description, analyse et commentaire sur les sites de recherche.

Google
 
Web www.dsi-info.ca
Actualités des sites de recherche avec http://www.wikio.fr/high-tech/internet/moteurs_de_recherche.

2007-11-07

 

Baisse de Google France


Baisse de Google France -- Le baromètre de Weborama et Aposition souligne une légère baisse de fréquentation de Google France alors que Yahoo! et Wanadoo voient leur part augmenter. Voici le communiqué :

Aposition publie avec Weborama son nouveau baromètre des outils de recherche, sur les chiffres d?octobre.
Google conserve sa place de leader malgré une petite baisse, il est à 88% des visites générées. Quant à Yahoo, il garde la deuxième place avec une légère hausse il passe à 3.5%, MSN quant à lui reste à 3%, Wanadoo gagne du terrain et passe à 2.3% soit une hausse de 1% pendant qu?AOL stagne en dessous des 1%.

Tous les autres moteurs se situent en dessous de la barre des 0.5%.

Dans l?ensemble une légère baisse pour le fameux Google alors que certains autres moteurs progressent?

En ce qui concerne les navigateurs, pas de changement particulier excepté pour Firefox 2, qui ne cesse de prendre de l?avant en passant à 18%.

Libellés : , , ,


2007-05-10

 

PC World publie une étude comparative


PC World publie une étude comparative -- La revue a publié une étude comparative comprenant les sites de recherche généralistes (Ask, Google, MSN Live Search et Yahoo!) et une dizaine de sites de recherche spécialisés. Exalead ne fait pas partie des sites de recherche retenus. L'étude Search Engine Shoot-Out est intéressante dans la comparaison des services, mais non pour le choix et l'analyse des requêtes. Les analystes s'appuient sur leurs requêtes pour faire des généralités parfois fausses. Il faut avoir une forte dose de sens critique pour savoir apprécier cette étude et ne pas craindre de confronter leurs requêtes avec d'autres similaires.
Bien que Google sort gagnant, les challengers le talonnent sinon le surpassent pour certaines requêtes. Les fonctions de recherche complémentaires, notamment celles d'Ask, sont des atouts.

Les résultats de recherche, surtout chez Google, sont changeants. Le pointage selon le classement des notices dans le résultat de recherche peut varier et donner un tout autre aperçu. Pour que l'étude soit valable, il faudrait qu'elle soit répétée au moins à chaque trimestre sur une année afin d'évaluer aussi le rafraichissement de la banque de données.

Libellés : , ,


2007-02-25

 

Recherche web : Acheteurs et chercheurs d'info lisent différemment


Recherche web : Acheteurs et chercheurs d'info lisent différemment -- La firme De Vos & Jansen Market Research and Search Engine Mediabureau Checkit a publié une étude oculométrique portant sur la lecture d'un résultat de recherche. L'étude est intitulée Buyers and information searchers view search results differently. Cinq sites de recherche ont fait l'objet de l'étude : Google, MSN Search Live, Ilse, Lycos et Kobala. Les participants devaient rechercher cinq produits et services populaires : un prêt pour une rénovation, une voiture d'occasion, une assurance auto, un billet d'avion vers New York et un lecteur MP3 de Philips. La moitié des répondants devait trouver de l'information sur les produits et services alors que l'autre moitié devait avoir l'intention de les acheter.

La firme néerlandaise conclut que :
  1. Les internautes prennent en moyenne 1,1 seconde pour lire une notice.
  2. 98% regardent les notices.
  3. 96% regardent les trois premiers liens commandités.
  4. 31% regardent les liens commandités latéraux.
  5. Les acheteurs lisent plus de notices (10) et prennent plus de temps à les lire toutes (11,4 secondes) en se concentrant sur les marques de commerce.
  6. Les chercheurs d'info lisent moins de 8 notices et prennent moins de temps à les lire toutes (9,4 secondes). Ils s'intéressent plus au contenu qu'aux marques de commerce.
Des recommandations habituelles suivent l'étude.

Source : Buyers and information searchers view search results differently, Checkit, Communiqué, 22 février

Libellés : ,


2007-02-09

 

Le tri par pertinence est-il fiable?


Le tri par pertinence est-il fiable? -- Il se publie sur le web des articles de sites suffisamment réputés pour que l'on ne les remette pas en doute. C'est le cas de Technaute de Cyberpresse, site d'informations du groupe Gesca possédant entre autres les grands journaux La Presse de Montréal et Le Soleil de Québec. Voici la chronique intitulée Le tri par pertinence est-il fiable ? apparemment sans reproche pour tout lecteur dans la section Conseil de pros.

Examinons quelques affirmations. Selon l'auteur, « il
existe plusieurs milliers de moteurs de recherche, dont une centaine de principaux. ». Le lien mène vers l'article en anglais «Search Engine » de Wikipedia. Un lien vers l'article en français aurait été tout aussi bien. En fait, il y a en quatre principaux : Ask, Google, Microsoft Live Search et Yahoo! Search, et deux secondaires : Exalead et Gigablast. Les autres sont des acteurs mineurs.

Selon l'auteur, les «moteurs de recherche» «s'appuient sur des algorithmes sémantiques pour indexer chacun des documents présents dans la base de données.» Les algorithmes ne sont pas sémantiques, ils sont statistiques et ils se basent sur les champs d'une page web (titre, URL, domaine, etc.), la position des mots entre eux et dans la page, leurs formats (sous-titre, casse, l'apparence de la police - gras, italique, etc. -, hyperliens... ), l'analyse des hyperliens entrants et sortants... , comme l'auteur l'écrit d'ailleurs! Les algorithmes sémantiques sont encore dans les laboratoires. Powerset est le logiciel de recherche web en préparation utilisant la recherche sémantique. Parmi les sites de recherche majeurs, Google donne un avant-gout avec son opérateur de synonyme (le tilde ~ ). Mais ce n'est pas encore de la recherche sémantique. Du côté européen, le projet allemand Theseus a pour but d'en développer un.

L'auteur semble ne pas maitriser ni la recherche sémantique, ni la recherche statistique, ni les concepts de moteur de recherche et de métachercheur tout comme Wikipedia en français dont Gigablast est identifié à un métachercheur alors qu'il est un automate de recherche (mais pas dans l'article en anglais de Wikipedia).

D'après l'auteur, certains «moteurs de recherche» privilégient les sites d'entreprises et d'autres non avec un exemple à l'appui sur Altavista.fr (qui n'est pas un «moteur de recherche» mais un «site de recherche» utilisant Yahoo! Search.) et Google.fr. Dans son exemple, il y a une erreur de méthodologie de recherche dans la comparaison. Sur AltaVista.fr, la recherche est limitée à la France ; sur Google.fr aux pages francophones. En limitant la recherche à la France sur Google, le résultat est similaire.

Il est heureux qu'il n'y ait pas de référence à DSI-info. Je serais gêné d'être cité.

Cela étant écrit, nul n'est sans tache.

En complément de lecture :

La ?cherche? se cherche? - L?approche technologique, Transnets (carnet Web de Francis Pisani), 23 janvier 2007

Libellés : , ,



Bienvenue au Carnet des sites de recherche. Vous trouverez dans ce carnet mes observations sur les sites de recherche autant états-uniens, canadiens que français. Si vous découvrez quoi que ce soit sur l'un ou l'autre site, n'hésitez pas à me contacter. Je me ferais un plaisir d'ajouter votre contribution.